Context engineering-LiHongYi

20251015

15:53

Context 中包含哪些内容?

 

对于Agent来说,需要不断和环境进行observation->reasoning->observation->reasoning……context就更长了。

 

虽然现在LLM的输入长度可以达到100万甚至更多,但是并不代表当输入长度超长时,LLM可以好的响应。

 

上图就表明,rag搜寻到的资料并不是越多越好。

 

并且答案在context的中间时,llm回答的准确率不如答案在context的开头和结尾,也就是llm更关注context的开头和结尾。

 

 

Context engineering 常用招数:

  1. select
  • rag,通过rag技术检索出最相关的内容放入context
  • tool rag,不要把所有的tool全部放入context中,挑选出最相关的tool即可
  • memory rag,不将整个agent history放入context中,只放入关键的片断(人的一生太漫长,只记住关键的几个瞬息);或者将history存储出文件中,然后进行memory rag检索出最相关的memory即可。
  1. compress

比如每100轮对话就压缩,或context长度达到某个界限就压缩

  1. multi-agent

 

 

 

已使用 OneNote 创建。